LDA(Latent Dirichlet Allocation)

历史

最早在2003年由Blei提出,是一种常用的主题模型.

参数

LDA模型有两个参数$ A $和$ B $.

  1. $ A $作为Dirichlet分布的参数来确定$\Theta$,
  2. $ \Theta $作为多项式分布的参数来确定主题在文本的分布,
  3. $ B$作为每个词在主题的分布, $ \beta_{i,j} = P(w_i | t_j) $,其中w表示词,t表示主题

In [ ]: